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基于 递归 投影 的 结构 性 网 络 能 入 
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(上 海 交 通 大 学 IOT 智能 物 联网 实验 室 , 上 海 200240) 


摘 要 : 近 些 年 来 ， 在 网 络 识 入 (network embedding) 领 域 的 大 多 数 研 究 都 着 眼 于 基于 网 络 节 点 邻接 关系 的 社区 身 
份 ， 如 Node2Vec 和 DeepWalk; 而 基于 网 络 拓扑 结构 的 结构 身份 的 研究 则 十 分 项 乏 ， 前 沿 方法 如 struc2vec 等 ， 通 
常 效率 很 低 。 提 出 了 RSNE(recurrent structural network embedding， 递 归结 构 性 网 络 肉 入 )， 一 种 新 颖 而 高 效 的 结构 
特征 学 习 方法 。RSNE 递归 式 地 把 节点 的 结构 身份 定义 为 其 邻居 结构 身份 的 非 线性 投影 。 为 了 避免 退化 为 基于 邻接 
关系 的 聚 类 ， 采用 了 一 种 有 效 而 鲁 棒 的 初始 化 方法 。 理 论 分 析 显 示 RSNE 在 时 间 复 杂 度 上 显著 优 于 现 有 的 结构 性 
网 络 谋 入 方法 ， 可 视 化 与 量化 实验 结果 也 表明 RSNE 在 在 分 类 准确 性 和 鲁 棒 性 上 达到 了 最 新 方法 相同 或 更 好 的 效 
果 ， 同 时 消耗 的 计算 时 间 与 空间 消耗 也 远 远 更 少 。 
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Structural network embedding based on recurrent projection 


Meng Yawen, Fu Luoyi, Wang Xinbing* 
(Research Center of Intelligent Internet of Things, Shanghai Jiao Tong University, Shanghai 200240, China) 


Abstract: In recent years, most researches in network embedding, such as Node2Vec and DeepWalk, are focused on the 
community identity defined by nodes' adjacency, instead of the structural identity defined by topology structure. And state- 
of-the-art methods of the latter, like struc2vec, are usually time-inefficient. This work presents RSNE(recurrent structural 
network embedding) , a novel and efficient method to learn node representation from structural identity. RSNE defines a 
node's structural identity as the non-linear projection of its neighbors' structural identities in a recurrent manner. In order to 
avoid degradation into clustering with nodes' adjacency, an accurate and robust initialization method based on degrees is 
applied in this work. Theoretical analysis shows that proposed method is significantly better than the existing methods in 
terms of time complexity, and can also effectively use hard disk space for memory optimization. Numerical visualized and 
quantified experiment results suggest that RSNE has equal or better performance than state-of-the-art methods in 
classification accuracy and robustness while consuming much less computation and time. 

Key words: network embedding; structural identity; feature learning 


构 定 义 的 结构 身份 的 研究 截至 撰 稿 时 却 依旧 十 分 匮乏 。 

2017 年 ，Ribeiro 等 人 提出 了 struc2vec， 一 种 从 结构 身份 学 

出 习 节 点 表征 的 新 方法 ， 其 中 他 们 把 结构 身份 定义 为 基于 网 络 
RA 结构 和 节点 关系 的 对 称 性 概念 00。 如 图 1 所 示 ， 图 中 Al- 

的 文章 和 最 热门 的 话题 ， 以 便 学 者 进行 科研 。 然 而 ， 由 于 网 EI 和 A2-E2 尽管 并 不 相 邻 ， 甚 至 相隔 一 个 复杂 网 络 ， 但 它 
络 数据 形式 复杂 ， 具 有 计算 复杂 度 高 、 并 行 性 低 、 不 适用 机 们 分 别 拥 有 相似 的 结构 ， 因 此 也 应 当 具 有 相似 的 结构 身份 。 
器 学 习 算 法 等 三 个 特性 山 ， 因 此 难以 直接 进行 挖掘 和 学 更 早 针 对 网 络 结构 身份 的 研究 往往 是 根据 邻接 关系 等 


前 ， 人 类 生活 中 存在 着 无 数 的 网 络 可 以 用 来 控 
宝贵 的 信息 与 知识 。 例 如 ， 学 术 引 用 网 络 可 以 挖掘 出 最 


f 


jil 


习 。 近 些 年 来 ， 随 着 随机 游 走 外 RU pm] ub aA R 信息 进行 相似 度 计算 ， 如 Glen Jeh 等 人 提出 SimRank 算法 
(word2vec)P! 在 数据 挖掘 中 的 引入 ， 网 络 挖掘 领域 出 现 了 许 02， 或 者 归于 预先 设 定 的 若干 类 别 中 ， 而 不 能 进行 高 维 空 
多 优秀 的 研究 成 果 ， 致 力 于 把 网 络 中 的 节点 表示 在 低 维 空间 间 中 的 结构 特征 提取 ， 较 为 接近 的 则 是 Kleinberg 提出 的 
中 ， 同 时 保留 其 网 络 结构 由。 最 前 沿 的 方法 ， 如 DeepWalk HITS 算法 031， 将 互联 网 的 网 页 根据 结构 特征 分 为 枢纽 页 面 
Dl, LINE", node2vecP!, fri AA 288032 TREES EUST (Hub) 和 权威 页 面 (Authority)， 这 其 实 可 以 看 做 一 种 简单 的 
了 显著 的 成 果 。 同 时 也 有 研究 表明 上 述 提 到 的 方法 本 质 上 都 结构 身份 表征 ， 但 只 能 在 两 个 维度 中 进行 ， 具 有 很 大 的 局 限 
能 等 效 为 一 种 封闭 形式 的 特殊 和 矩阵 分 解 昌 。 然而 ， 除 了 上 性 。 而 该 细 分 领域 最 前 沿 的 成 果 之 一 则 是 Ribeiro 等 人 提出 
述 方法 ， 最 近 两 年 (2017 一 2018 年 ) 还 涌现 出 了 许多 鼎新 的 网 的 struc2vec[11]， 它 首先 根据 节点 每 一 层 邻 居 的 度 序列 利用 
络 谍 入 的 工作 5 细 ， 虽 然 他 们 的 效果 都 很 优异 ， 但 是 却 都 只 DTW(Dynamic Time Warping， 动 态 时 间 变 换 ) 算 法 两 两 计算 
关注 有 节点 邻接 关系 定义 的 社区 身份 ， 而 基于 由 节点 拓扑 结 节点 间 的 结构 相似 度 ， 然 后 据 此 建立 一 个 分 层 网 络 ， 网 络 每 
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一 层 都 代表 N 阶 邻 居 内 的 相似 性 ， 层 内 是 完全 图 ， 每 条 边 
的 权重 代表 节点 在 某 个 半径 下 的 相似 度 ， 层 间 同 一 个 节点 对 
的 节点 相互 连接 ， 然 后 在 这 个 新 的 多 层 相似 性 权 值 网 络 中 
利用 流行 的 随机 游 走 + 词 向 量 嵌 入 模型 的 方法 进行 网 络 嵌 
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将 具体 阐释 本 算法 能 够 满足 上 述 性 质 的 原 
以 验证 。 
1.2.1 基于 直接 邻居 的 结构 身份 初始 化 


考虑 一 个 无 向 、 无 权重 网 络 G = (V E), 


入 ， 最 终 获 得 每 个 节点 结构 身份 的 特征 表示 。 该 方法 确实 能 
很 好 的 学 习 到 网 络 节点 的 结构 身份 ， 但 其 相似 性 网 络 的 构建 
过 程 却 十 分 复杂 ， 需 要 预先 构建 每 个 节点 不 同 半径 下 邻居 的 


构 身 份 相似 的 节点 ， 其 本 身 的 度 必 然 是 相似 的 ， 


天， 并 设计 实验 予 


集 ，E 为 边 集 ， 如 图 2 中 AI. A2. B 三 点 ， 本 文 会 发 现 结 


其 直接 邻居 


度 来 衡量 。 


此 外 ， 


度 序列 ， 而 后 两 两 计算 每 个 半径 下 的 相似 度 ， 最 后 才能 进行 


网 络 垦 入 ， 在 实际 计算 中 ， 度 序列 和 相似 度 的 计算 通常 占 总 
时 间 开 销 的 90% 以 上 ， 算 法 效率 较 低 。 


(E1) (D1) l ~ {D2) (E2) 
Bl )—(A1) 复杂 网 络 ( A2 )—( B2) 
(c) (c2) 


图 1 结构 身份 的 演示 。 图 中 节点 Al、A2 拥有 相似 的 结构 ， 因 此 
结构 身份 也 应 该 相似 。 


Demostration of structure identity, node A1 and A2 should 


Fig. 1 
have similar structure identities due to their similar local structures. 

因此 ， 本 文 提 出 了 一 种 全 新 的 算法 ， 利 用 递归 投影 的 
方法 进行 结构 身份 的 网 络 娱 入， 并 在 可 视 化 结果 、 分 类 精 
度 、 对 抗 随机 边 采样 的 鲁 棒 性 和 算法 效率 上 与 最 前 沿 的 算法 
进行 比较 。 


1 ”基于 递归 投影 的 结构 性 网 络 能 入 


1.1 结构 性 网 络 能 入 的 要 求 

为 了 并 保证 结构 性 网 络 嵌 入 的 效果 ， 学 界 认为 良好 的 
结构 性 网 络 散 入 算法 应 当 至 少 满 足以 下 三 种 性 质 : 

a) 结 构 相 似 的 节点 ， 其 网 络 散 入 结果 也 应 当 相 似 ， 如 图 
2 中 的 Al 与 A2 节点 ， 这 保证 了 算法 的 平滑 性 和 稳定 性 ， 
相似 的 输入 对 应 的 输出 也 是 相似 的 。 

b) 结 构 不 同 的 节点 ， 其 网 络 对 入 结果 也 尽量 不 同 ， 如 图 
2 中 的 Al 与 B 节点 ， 这 保证 了 算法 的 区 分 度 ， 能 够 尽 可 能 
地 区 分 具有 不 同 结构 的 网 络 节点 。 
c) 网 络 嵌 入 结果 与 节点 属性 、 空 间距 离 等 无 关 ， 如 图 1 
中 Al 与 A2 节点 ， 显 然 一 个 网 络 节点 的 拓扑 结构 特征 只 与 
它 的 局 部 邻接 节点 有 关 ， 因 此 位 于 网 络 中 不 同位 置 的 节点 ， 
若 其 结构 相似 ， 其 戏 入 也 应 该 相似 。 


A1 A2 j-A B 


图 2 具有 不 同 结构 身份 的 网 络 节点 演示 

Fig.2 Demostration of nodes with different structure identities 
1.2. TTE DUAE ER AN BA) ERE 

根据 1.1 节 中 的 要 求 ， 本 文 提 出 了 一 种 基于 递归 投影 的 
结构 性 网 络 葡 入 算法 ， 即 RSNE(recurrent structural network 
embedding)， 算 法 核心 思想 在 于 将 每 个 节点 的 结构 身份 视 为 
其 直接 邻居 结构 身份 的 非 线 性 投影 ， 也 即 是 其 结构 特征 向 量 
其 邻居 的 结构 特征 向 量 经 由 非 线 性 映射 迭代 而 得 到 。 算 法 
分 为 三 个 步骤 ， 依 次 为 基于 直接 邻居 的 结构 身份 初始 化 、 基 
于 非 线 性 投影 的 迭代 计算 、 基 于 数据 标准 化 的 后 处 理 ， 以 此 
满足 上 述 三 条 性 质 ， 并 生成 合理 的 结构 身份 特征 表示 ， 下 文 


6 的 点 。 
份 初 始 化 方 


也 必然 是 相似 ， 后 者 的 相似 性 同样 可 以 
度 带 来 的 结构 身份 差异 应 当 是 负 指 数 型 分 布 的 ， 例 如 度 为 
100 和 101 的 点 ， 其 结构 差异 显然 小 于 度 为 5 和 
基于 以 上 考虑 ， 本 文 提 出 了 如 下 的 结构 身 
法 : 
为 从 1 开始 的 每 个 度 di i > 1, 分 配 一 个 单位 随机 向 量 
Ui, 


对 每 个 节点 v EV， 度 为 4,， 则 其 向 量 初 始 化 为 


E 
A 
> 
2 
Zr 

| 
$ 
2 


其 中 第 1 步 保证 


初始 特征 向 量 中 ， 为 后 续 计算 打 好 基础 。 
1.2.2 基于 非 线性 投影 的 迭代 计算 

初始 化 的 结构 特征 向 量 已 经 能 够 捕捉 每 个 
结构 信息 ， 但 是 无 法 将 更 大 尺度 的 拓扑 结构 纳 


g 


， 算 法 描述 如 下 : 


对 每 个 v EV, 令 


其 中 : 令 D 为 特征 向 量 的 维度 ， 


此 ， 本 文 继续 通过 非 线性 投影 迭代 的 方法 ， 即 是 将 节点 邻 
的 特征 向 量 非 线性 映射 为 新 特征 后 投影 成 当前 节点 的 特征 


邻居 的 初始 向 量 投影 到 该 节点 上 ， 即 


度 带 来 的 结构 身份 差异 为 负 指数 型 分 布 ， 
第 2、3 步 分 别 将 节点 本 身 和 直接 邻居 的 基本 结构 特征 纳入 


节点 的 基本 
入 考虑 ， 因 
z 
可 


考虑 邻接 矩阵 为 Nas, n 为 图 中 节点 数量 ， 


所 有 节点 的 


特征 向 量 组 成 特征 矩阵 Fx:a， 则 算法 的 每 次 迭代 都 可 表示 为 


1.2.3 基于 数据 标准 化 的 后 处 理 


经 过 递归 投影 后 ， 特 征 和 矩阵 Fra 的 每 一 维 分 布 都 不 相 


同 ， 可 能 会 影响 结构 性 网 络 供 入 的 效果 ， 因 此 需要 进行 数据 


标准 化 ， 即 把 Fusa 的 每 一 维 的 特征 值 都 线性 变换 为 均值 为 


0， 标 准 差 为 1 的 标准 化 数据 。 
1.2.4 算法 总 结 
算法 第 一 步 以 一 阶 信 


居 作 为 特征 得 到 的 初始 化 特征 向 


量 能 够 描绘 出 网 络 节点 最 基本 的 结构 特性 ， 同 时 使 用 


HAUT 


布 来 保证 算法 的 平滑 性 和 区 分 度 ， 为 后 续 更 精 允 
提供 基准 。 
第 二 步 的 递归 投影 则 是 为 了 将 邻居 节点 的 


入 到 中 心 节 点 中 ， 这 样 便 使 得 中 心 节点 的 特征 向 量 能 够 描绘 


的 特征 提取 


特征 向 量 融 


出 更 大 范围 内 的 结构 特性 ， 


同时 递归 方式 也 能 保证 更 近 的 节 


点 拥有 更 大 的 投影 权重 


使 得 算法 结构 更 加 合理 。 
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第 三 步 的 数据 标准 化 则 是 为 了 保证 特征 向 量 的 有 效 有 34 对 节点 的 镜像 图 ， 下 面 分 别 使 用 RSNE 和 struc2vec 在 
性 ， 避 免 向 量 中 某 些 随机 产生 的 极端 维度 造成 意外 干扰 。 该 镜像 图 中 运行 ， 并 各 自得 到 128 维 结构 特征 向 量 ， 并 将 结 
下 文 将 进行 多 项 实验 以 全 面 测 试 并 证 明 本 算法 能 够 满 ” 果 数 据 标准 化 后 计算 对 应 镜像 节点 对 的 平均 欧 氏 距离 和 所 有 


AE 2.1 中 所 提出 的 要 求 ， 并 获得 优秀 的 基于 结构 特征 的 网 络 。 节点 对 的 平均 欧 氏 距离 ， 同 时 计算 后 者 和 利用 DTW 算法 得 


BAA. 到 节点 相似 度 分 析 Pearson 相关 系数 ， 其 结果 如 表 1 所 示 。 
2 ”实验 设计 与 分 析 Lu. "ur 
本 节 将 参考 struc2vect11 进 行 多 项 实验 的 分 析 和 对 比 ， e p 
并 从 可 视 化 结果 、 结 构 特征 向 量 与 节点 间 相似 度 的 相关 性 、 il ge 
对 抗 随机 边 采样 的 鲁 棒 性 、 针 对 真实 数据 集 的 分 类 精度 以 及 ide 
算法 效率 等 方面 衡量 算法 效果 ， 并 与 最 前 沿 的 算法 ， 也 即 V] eles 
2017 年 的 struc2vec 算法 0 进行 对 比 。 & 
2.4 杠铃 图 
图 3() 是 一 张 典 型 的 杠铃 图 ， 可 表示 为 BC10,10), 含义 7] 
为 左右 两 侧 各 有 10 个 点 为 全 连接 ， 中 间 10 点 依次 连接 沟通 
两 侧 。 显 然 图 中 颜色 相同 的 节点 拥有 完全 相同 的 结构 特征 ， 72] 
如 左右 两 侧 浅 蓝 色 的 18 个 点 。 
E ee 
一 1.0 —0.5 0.0 0.5 1.0 1.5 2.0 2.5 
TN (a) struc2vec 可 视 化 效果 
KE ES 
t 2 Y X < P< 
EOD LESS OS s 
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(a) 杠 铃 图 B(10,10) [11] 
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(b) RSNE 可 视 化 效果 
图 4 杠铃 图 效果 对 比 
Fig.4 Comparison on the barbell graph 
表 1 空手 道 俱 乐 部 镜像 关系 图 的 结构 性 网 络 嵌 入 结果 


Table 1 Structural network embedding results of the mirrored Karate 


Club graph 
(b) 空手 道 俱 乐 部 关系 图 [14] 方法 ”镜像 对 距离 ”所 有 点 距离 ”Pearson-0 层 Pearson-2 层 ”Pearson-4 层 
图 3 两 种 特殊 的 图 Struc2vec 3.07 15.54 0.83 0.71 0.70 
Fig.3 Two special graphs RSNE 0.00 11.77 0.93 0.66 0.58 
图 4 展示 了 本 文 RSNE 与 struc2vec 算法 在 128 维特 征 可 以 发 现 ， 在 欧 氏 距离 上 ， 本 文 提 出 的 RSNE 可 以 保 


空间 的 学 习 结 果 经 过 PCA 降 维 后 在 平面 的 可 视 化 效果 。 可 ”证 镜像 对 距离 为 0， 这 上 比 收 到 随机 性 影响 的 struc2vec 要 优 
以 看 出 ， 两 者 都 能 把 共计 7 种 点 很 好 地 区 分 开 ， 其 中 结构 特 。 秀 得 多 。 同 时 在 节点 距离 和 DTW 相似 度 的 相关 性 上 ， 

征明 显 的 0-2 类 各 自分 散 得 很 开 ， 而 处 在 图 中 间 ， 结 构 特征 RSNE 在 浅 层 网 络 结构 的 相关 性 更 好 ， 而 在 深层 网 络 结构 的 
类 似 的 3-6 类 的 点 则 较为 接近 。 两 者 不 同 之 处 在 于 ， 相关 性 更 差 ， 这 事实 上 是 非常 合理 的 ， 因 为 DTW 对 节点 每 
struc2vec 同一 类 之 间 也 会 有 一 定 距 离 ， 这 是 随机 游 走 和 词 。 层 邻 居 的 计算 都 是 同 权 的 ， 但 显然 浅 层 的 邻居 对 节点 的 结构 
向 量 模型 训练 过 程 中 引入 的 不 可 避免 的 随机 性 ， 甚 至 到 了 类 ”身份 影响 更 大 。 


5 和 类 6 ROTE, M RSNE 则 没有 这 个 问题 。 2.8 ”对抗 随 机 边 采 样 
2.2 空手 道 俱乐部 镜像 关系 图 本 实验 使 用 Facebook 的 一 份 社交 网 络 图 ， 其 中 包含 


空手 道 俱 乐 部 关系 图 由 34 个 点 、78 条 边 组 成 ， 是 网 络 224 个 节点 ，3192 条 边 ， 记 为 G = (VE) ， 而 后 将 G 中 每 条 
嵌入 研究 中 常用 的 一 张 图 ， 如 图 3(b) 所 示 。 这 里 仿照 H e cE, 按照 概率 s 随 机 采样 保留 ， 得 到 G* = (V E), 
struc2vec， 将 该 图 点 、 边 复制 一 遍 后 仍 放 入 原 图 ， 构 成 一 个 ” 将 G G* 放 入 同一 个 网 络 中 进行 结构 性 网 络 租 入 ， 而 后 计算 
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G G 中 对 应 点 的 欧式 距离 ， 该 距离 分 布 可 以 表示 如 图 5 所 
Ro 


(a) struc2vec Kk RIE Ey 7j pU! 


p=1 mirrored pairs 
p=1 all pairs 
p=0.99 mirrored pairs 
* p=0.99 all pairs 
p=0.9 mirrored pairs 
x  p-0.9 all pairs 
p=0.7 mirrored pairs 
*  p-0.7 all pairs 
p=0.5 mirrored pairs 
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p=0.3 mirrored pairs 
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(b)RSNE 欧 氏 距离 分 布 
图 5 边 采 样 模型 下 对 应 点 欧 氏 距离 的 分 布 


Fig.5 Distance distribution between node pairs under the edge 


sampling model 


显而易见 ， 随 着 采样 概率 的 降低 ，G 中 保留 的 边 逐 渐 


减少 ， 节 点 对 之 间 结 构 身 份 差异 也 将 越 来 越 大 ， 因 而 其 结构 
特征 向 量 的 欧 氏 距离 也 应 该 越 来 越 大 ， 图 5 的 实验 结果 与 此 
完全 一 致 ， 边 保留 较 多 时 节点 对 的 特征 向 量 差距 不 大 ， 甚 至 
在 丢失 大 约 70% 的 边 时 ， 算 法 仍 能 维持 节点 对 之 间 结 构 向 
量 的 相似 性 ， 同 时 所 有 节点 对 的 平均 距离 仍 保持 在 较 大 的 水 


分 接近 ， 但 是 其 算法 复杂 度 和 实际 时 间 开 销 却 远 小 于 
struc2vec， 具 体 可 见 2.5 小 节 。 
2.5 算法 时 间 开 销 


平 ， 这 证 明 RSNE 在 鲁 棒 性 上 达到 了 和 前 沿 成 果 相 当 的 表 
现 。 
2.4 针对 机 场 数据 的 分 类 实验 


网 络 和 嵌入 的 应 用 之 一 就 是 节点 分 类 ， 本 文采 


struc2vect 提 供 的 美国 和 欧洲 的 机 场 航班 往来 网 络 进行 分 
类 实验 ， 以 美国 机 场 网 络 为 例 ， 图 中 共有 1190 个 节点 ， 代 
表 各 个 机 场 ， 共 有 13599 条 边 ， 代 表 航 班 往来 。 所 有 机 场 
按照 人 流量 和 航班 数 等 信息 分 为 4 类 ， 本 实验 首先 利用 
RSNE 和 struc2vec 进行 结构 性 网 络 租 入 ， 在 结果 中 选取 
80% 的 样本 作为 训练 集 ， 剩 余 样 本 作为 测试 集 ， 通 过 逻辑 下 
归 方 法 进行 分 类 ， 分 类 结果 如 表 2 所 示 。 


可 以 看 出 RSNE 的 分 类 效果 与 struc2vec 分 类 准确 率 十 


针对 以 上 实验 所 涉及 的 五 张 图 ， 本 文 分 别 统计 了 RSNE 
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和 struc2vec 的 时 间 开 销 ， 结 果 记 录 为 表 3， 可 以 看 到 ， 对 
同样 的 网 络 进行 结构 特征 的 学 习 ，RSNE 所 消耗 的 时 间 远 远 
小 于 struc2vec， 甚 至 不 到 后 者 的 1%， 但 在 鲁 棒 性 、 分 类 精 
度 上 到 了 相似 的 结果 ， 这 充分 说 明 的 本 方法 的 有 效 性 和 优越 
性 。 


表 2 美国 和 欧洲 的 机 场 航班 往来 网 络 分 类 准确 率 


Table 2 Classification accuracy of US and European airport flight 


network 
机 场 美国 欧洲 
Struc2vec 0.64 0.59 
RSNE 0.63 0.61 


表 3 在 不 同 图 上 ，RSNE 和 struc2vec 的 时 间 开 销 


Table 3 Time consumption of RSNE and struc2vec on different 


graphs 
图 名 点 数 边 数 Struc2vec 耗 时 — RSNE 耗 时 
杠铃 图 30 101 18.78 0.06 
空手 道 俱乐部 图 68 155 21.82 0.10 
Facebook 图 224 3192 33.09 0.30 
欧洲 机 场 图 399 5995 52.88 0.50 
美国 机 场 图 1190 13599 195.12 1.83 


3 ”结束 语 


本 文 将 结构 身份 定义 为 节点 所 在 局 部 网 络 的 拓扑 结构 
特征 ， 它 通常 能 代表 节点 在 网 络 中 的 作用 、 地 位 等 ， 如 论文 
引用 网 络 的 中 高 质量 论文 、 社 交 网 络 中 的 明星 用 户 。 本 文 针 
对 当前 网 络 租 入 在 结构 身份 方面 的 匮乏 和 前 沿 成 果 的 不 足 ， 
提出 了 由 在 学 习 网 络 中 节点 结构 身份 在 向 量 空间 中 特征 表示 
的 新 颖 而 精简 的 算法 ，RSNE。 

RSNE 首先 进行 基于 度 和 直接 邻居 的 特征 向 量 初始 化 ， 
而 后 利用 递归 投影 技术 学 习 节 点 更 深层 、 更 精细 的 结构 特 
征 ， 最 后 通过 数据 标准 化 保证 输出 结果 的 可 用 性 。 由 于 本 方 
法 未 使 用 两 两 计算 相似 度 的 方式 进行 网 络 结构 身份 的 采样 ， 
姑 而 能 够 将 算法 复杂 度 控 制 在 较 低 水 平 。 

在 多 个 图 上 进行 的 实验 表明 ，RSNE 能 够 有 效 捕捉 网 络 
节点 的 结构 身份 ， 在 保证 分 类 准确 性 的 同时 ， 也 能 够 维持 民 
好 的 鲁 棒 性 ， 而 且 在 计算 过 程 中 花费 的 时 间 远 远 小 于 相关 前 
沿 成 果 ， 如 struc2vec。 
本 文 认为 在 更 注重 节点 结构 的 网 络 数据 挖掘 任务 中 
如 某 学 术 会 议 中 学 术 新 星 的 发 掘 ， 结 构 性 网 络 庶 入 方法 拥有 
node2vec, LINE. Deepwalk 等 方法 不 可 比拟 的 优势 ， 这 也 
是 本 文 提出 RSNE 的 贡献 和 意义 所 在 ， 同 时 本 文 所 用 到 的 
简化 网 络 谋 入 的 思想 也 可 以 应 用 到 更 为 广阔 的 领域 中 ， 如 应 


一 


oc 


w 
用 到 室内 定位 网 络 中 等 553。 
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